EvoClass
AI032
大規模並列プロセッサのプログラミング:実践的なアプローチ
メモリ最適化と共有メモリタイリング
講義
第5講義
日付
2026年4月22日
講師
AIチューター
所要時間
60分
学習目標
GPUメモリの階層構造および遅延特性を理解する
グローバルメモリのコールセシングパターンを特定する
共有メモリを活用した1次元および2次元タイリング戦略を実装する
共有メモリバンクの競合を分析し、対処する
タイリングありとなしの実装における性能向上を比較する